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Securitatea informaţiilor în lucrul cu megadate pe Internet 


Nicolae Sfetcu 


Rezumat 


Securitatea megadatelor (big data) presupune aderarea la conceptele de comportament etic 
corect şi greşit în ceea ce priveşte datele, în special datele cu caracter personal. Etica big data pune 
accentul pe colectorii şi diseminatorii de date structurate sau nestructurate. Securitatea şi 
confidențialitatea informațiilor este susținută, la nivelul UE, de o amplă documentație, prin care se 
încearcă să se găsească soluții concrete pentru maximizarea valorii informaţiilor fără a sacrifica 
drepturile fundamentale ale omului. Autoritatea Europeană pentru Protecția Datelor (AEPD) 
sprijină dreptul la viaţă privată şi dreptul la protecția datelor cu caracter personal în respectul 


demnităţii umane. 


Cuvinte cheie: securitatea informaţiilor, securitate, informaţii, megadate, big data, 
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Abstract 


Big data security involves adhering to the concepts of right and wrong ethical behavior 
with respect to data, especially personal data. Big data ethics focuses on the collectors and 
disseminators of structured or unstructured data. Information security and privacy is supported, at 
EU level, by extensive documentation, which seeks to find concrete solutions to maximize the 
value of information without sacrificing fundamental human rights. The European Data Protection 
Authority (EDPS) supports the right to privacy and the right to the protection of personal data 


respecting human dignity. 
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Securitatea informaţiilor presupune aderarea la conceptele de comportament corect şi greşit 
în ceea ce priveşte datele, în special datele cu caracter personal. Etica megadatelor pune accentul 
pe colectorii şi diseminatorii de date structurate sau nestructurate. 

Securitatea și confidențialitatea informaţiilor este susţinută, la nivelul UE, de o amplă 
documentaţie, prin care se încearcă să se găsească soluţii concrete pentru maximizarea valorii Big 
Data fără a sacrifica drepturile fundamentale ale omului. Autoritatea Europeană pentru Protecţia 
Datelor (AEPD) sprijină dreptul la viaţă privată și dreptul la protecția datelor cu caracter personal 
în respectul demnității umane. Conform acestor documente, trebuie să se depășească conflictul 
conceptual dintre viața privată și Big Data,și între intimitate şi inovaţie. Este esențial să se 
identifice modalităţile de includere a dimensiunii etice în conceperea inovaţiilor. (European 
Economic and Social Committee 2017) 

Conform noului Regulament al UE 2016/679, operatorii de date trebuie să pună în aplicare 
măsurile de confidențialitate şi tehnologiile de îmbunătățire a confidenţialității în momentul 
determinării modalităţilor de procesare şi al procesării în sine. Prin ENISA75 au fost identificate 
multe strategii de confidenţialitate prin design (minimizarea datelor, ascunderea datelor cu caracter 
personal şi interconexiunile acestora, prelucrarea separată a datelor cu caracter personal, alegerea 
celui mai înalt nivel de agregare, transparența, monitorizarea, politica de confidenţialitate, aspecte 


legale). 
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O modalitate de bază pentru coexistenţa pașnică dintre exploatarea Big Data şi protecția 
datelor este controlul, de către utilizator, a datelor personale, ceea ce conduce la transparenţă și 
încredere între utilizatori şi furnizorii de servicii digitale. După cum s-a subliniat în evaluarea 
impactului GDPR, 


"Construirea încrederii în mediul online este esențială pentru dezvoltarea economică. Lipsa de 
încredere îi face pe consumatori să ezite să cumpere online şi să adopte noi servicii, inclusiv 
serviciile publice de e-guvernare. Dacă nu este abordată, această lipsă de încredere va 
continua să încetinească dezvoltarea utilizărilor inovatoare ale noilor tehnologii, să 
acționeze ca un obstacol în calea creşterii economice şi să blocheze sectorul public în a 
profita de beneficiile potenţiale ale digitalizării serviciilor sale." 


În cazul Big Data modelele tradiţionale de consimțământ sunt insuficiente şi depășite. 
"Consimțământul ar trebui să fie suficient de granular pentru a acoperi toate procesele diferite şi 
scopurile de prelucrare şi reutilizare a datelor cu caracter personal.” (European Economic and 
Social Committee 2017) 

O problemă specială este portabilitatea datelor, susținută la nivelul UE de AEPD în Avizul 
7/2015, (MORO 2016) unde se impune garantarea dreptului cetățenilor de a accesa şi corecta 
datele personale printr-un control extins. Portabilitatea datelor poate ajuta la creşterea gradului de 
conştientizare şi control al consumatorilor prin transferul între servicii online. 

AEPD consideră că datele cu caracter personal ar trebui să fie tratate la fel ca alte resurse 
importante, precum petrolul, unde tranzacționarea are loc între părți la fel de bine informate 
(simetria informaţională). În realitate, piaţa informaţiilor cu caracter personal are un caracter de 
asimetrie informațională, nefiind nici transparentă, nici echitabilă, clienţii nefiind compensaţi 
pentru informaţiile personale pe care le oferă. Astfel, portabilitatea datelor ar încuraja un mediu 
mai competitiv între beneficiarii acestor date, utilizatorii având posibilitatea să aleagă cui oferă 
atele personale. 

O altă abordare pune în discuţie stocarea datelor cu caracter personal, cu posibilitatea 
pentru utilizator de a acorda sau retrage consimțământul pentru datele sale personale. (MORO 
2016) (DG Connect 2015) Stocarea datelor cu caracter personal implică un "concept cadru şi o 
implementare arhitecturală care transferă achiziția şi controlul datelor de la un model de date 
distribuit la un model orientat spre utilizator.” (European Economic and Social Committee 2017) 
Portabilitatea datelor ar putea asigura acest deziderat. 

AEPD susține promovarea beneficiarilor responsabili şi reducerea birocraţiei în protecția 


datelor, prin coduri de conduită, audituri, certificări, şi o nouă generație de clauze contractuale şi 
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reguli corporative obligatorii. Responsabilitatea beneficiarilor Big Data presupune instituirea unor 
politici interne şi a unor sisteme de control conforme cu legislația în vigoare, prin soluții inteligente 
şi dinamice care să garanteze respectarea principiilor fundamentale (minimizarea datelor, limitarea 
scopului, calitatea datelor, procesarea corectă şi transparentă a datelor, design, limitare de stocare, 
integritate şi confidențialitate). 

Etica datelor se bazează pe următoarele principii: proprietatea (persoanele fizice deţin 
propriile date, transparenţa tranzacţiilor (utilizatorii trebuie să aibă acces transparent la 
proiectarea algoritmului), consimțământ (utilizatorul trebuie să fie informat şi să își exprime 
explicit consimțământul cu privire la utilizarea datelor personale, confidenţialitate (trebuie 
protejată confidențialitatea utilizatorilor), financiar (utilizatorul să cunoască tranzacțiile 
financiare rezultate din utilizarea datelor lui personale), şi deschidere (seturile de date agregate să 


fie disponibile în mod liber). 


Etica în cercetare 


Termenul de studiu critic de date (SCD) implică faptul că cercetătorii investighează Big 
Data din perspective critice. Studierea datelor în acest context implică, pe lângă analiza lor, şi 
încorporarea datelor în practici (cunoaşterea), instituții şi sisteme politice şi economice, prin 
interacțiunea complexă dintre date şi entităţile care le produc, dețin și folosesc. 

Un raport al OECD (2013) subliniază că, spre deosebire de normele etice aplicate datelor 
obişnuite de cercetare, în cazul Big Data: (OECD 2013) 


e Colectarea de date nu a făcut obiectul unui proces formal de examinare etică. 
e Normele etice obișnuite nu vor fi implementate în cazul Big Data 

e Utilizarea datelor pentru cercetare poate să difere de scopul inițial. 

e Datele nu mai sunt deţinute ca seturi discrete. 


Relaţia dintre cei care oferă datele şi cei care le folosesc este adesea indirectă şi variabilă. 
Un raport mai recent al OECD (2016) susține că această relaţie este mai slabă sau inexistentă, Big 
Data limitând capabilitățile obişnuite. (OECD 2016) 

Stocarea datelor e importantă pentru integritatea cercetării. Datele trebuie să aibă o 


"proveniență" clară, cu surse şi procesare cunoscute, identificate şi documentate. 
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Multe date care nu sunt colectate special pentru cercetare au standarde diferite în cercetarea 
datelor. 

Pentru anumite date, adesea cu valoare comercială (de ex., datele colectate pe Twitter), 
există restricții legale privind reproducerea lor. (UK Data Service 2017) 


Depozitele de date trebuie să respecte standardele de transparență şi reproductibilitate. 


Conştientizarea 


Conştientizarea tipului de date care sunt furnizate în timpul unei înregistrări online (pentru 
crearea unui cont, sau un abonament, de ex.) este un fapt rar, mai ales că există posibilitatea 
folosirii unei identități digitale deja existente (profil Facebook, de ex.) în locul unei înregistrări 
separate, pentru un acces mai rapid. Astfel de situaţii creează o opacitate cu privire la datele 


partajate între furnizorul de identitate şi serviciul utilizat. 


Consimţământul 


Pentru utilizarea datelor cu caracter personal ale unei persoane, este nevoie de 
consimțământul informat şi explicit exprimat al acesteia referitor la cine, când, cum şi în ce scop 
se folosesc. Când trebuie partajate datele, aceste utilizări trebuie aduse la cunoștința persoanei. Ar 
trebui să fie întotdeauna posibilă retragerea consimțământului pentru viitoarele utilizări. 

În analizele Big Data, se poate cunoaşte foarte puţin despre utilizările viitoare intenţionate 
ale datelor, și despre beneficiile, şi riscurile implicate. Aici, există proceduri pentru 
consimțământul "larg" şi "generic" de a împărtăşi datele genomice, de ex., şi în scopuri diferite. 
Chiar şi atunci când se procedează corect, există anumite provocări practice specifice: obținerea 
consimțământului în cunoștință de cauză poate fi imposibil sau foarte costisitor, iar valabilitatea 


consimțământului este disputabil când acordul este obligatoriu pentru a accesa un serviciu. 


Controlul 


În lumea actuală, datele personale pot fi tranzacţionate la fel ca orice monedă în 
implementarea Big Data. Există opinii diferite în ce măsură această situaţie este una etică, inclusiv 
cine să participe la profitul obținut din aceste tranzacționări.. 

În modelul de tranzacţionare a datelor cu caracter personal, transmiterea datelor personale 
este un cadru care oferă persoanelor posibilitatea de a-şi controla identitatea digitală şi a crea 


acorduri granulare de partajare a datelor. 
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În prezent prinde contur ideea datelor deschise, centrată în jurul argumentului că datele ar 
trebui să fie disponibile în mod liber. Dorinţa de a partaja date variază în funcţie de persoană. 

În cazul copiilor, părinţii sau tutorii au responsabilitatea pentru datele lor, care nu pot fi 
tranzacţionate contra beneficii financiare. 

La nivel naţional, un guvern este suveran asupra datelor generate şi colectate. La 26 
octombrie 2001 a intrat în vigoare Actul Patriot în SUA, iar la 25 mai 2018, Regulamentul general 
privind protecția datelor 2016/679 (GDPR) la nivelul Uniunii Europene, pentru problemele legate 
de protecţia datelor personale. 

În Big Data, relația om-date este asimetrică, bazată pe controlul datelor. "Dreptul de a fi 
uitat”, adoptat la nivelul UE, este unul din elementele de bază ale controlului unui individ asupra 


datelor sale personale. 


Transparenţa 


Algoritmii utilizați în Big Data pot determina prejudecăți care afectează sistematic 
drepturile individului. De aceea, proiectarea algoritmului ar trebui să fie transparentă și inclusivă. 

Guvernarea anticipativă implică analize predictive pe baza Big Data pentru a evalua 
potențiale comportamente, cu implicaţii etice care pot încuraja prejudecățile şi discriminarea. 

O persoană care acceptă includerea datelor sale personale în Big Data are dreptul să ştie de 


ce se colectează datele, cum vor fi folosite, cât timp vor fi stocate, şi cum pot fi modificate. 


Încrederea 


Increderea în sistemele Big Data este legată de interdependenţe cu confidențialitatea și 
conştientizarea. Până în prezent, încrederea a fost considerată din perspectivă strict tehnologică. 
Se speră să se realizeze arhitecturi hardware și software care ar putea creşte încredere între ființe 


umane şi obiecte, şi deci o mai mare acceptanţă a utilizării datelor personale. 


Proprietatea 


O întrebare fundamentală în etica cercetării cu Big Data este, cine deține datele? Aceasta 
implică subiectul drepturilor şi obligaţiilor asupra proprietăţii. În legislaţia europeană, GDPR 
indică faptul că persoanele dețin propriile date cu caracter personal. 


Suma datelor personale ale unui individ formează o identitate digitală. 
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Protecția drepturilor morale (dreptul de a fi identificat ca sursă a datelor, şi de a le controla) 
ale unui individ se bazează pe opinia că datele personale sunt o expresie directă a personalității 
acestuia, și nu pot fi transferate unei alte persoane decât, eventual, prin succesiune atunci când 
individul moare. 

Proprietatea implică exclusivitate, respectiv restricționarea implicită a altora în ceea ce 
priveşte accesul la proprietate. O proprietate eficientă a datelor personale implică portabilitatea, 
posibilitatea de a folosi alternative fără a pierde din date. Standardizarea ar ajuta, de asemenea, la 
curățare datelor personale. 

În mod efectiv, în prezent, datele sunt deţinute de proprietarul senzorilor, cel care 
efectuează înregistrarea sau entitatea care deține senzorul. 

În UE, s-a restrâns în mod progresiv posibilitatea ca datele cetăţenilor UE să fie stocate în 
afara aşa-numitului "Euro cloud", dar nu s-a rezolvat problema datelor deja stocate şi prelucrate în 
altă parte, și "nu rezolvă dilema etică a modului în care proprietatea asupra datelor este definită în 
mod filosofic, înainte de a trece la o abordare mai degrabă a legii și a elaborării politicilor.” 


(European Economic and Social Committee 2017) 


Supravegherea şi securitatea 


Din ce în ce mai multe surse de date sunt disponibile cu ajutorul tehnologiilor avansate, 
precum circuitele CCTV, GPS, dispozitive mobile, carduri de credit, ATM. De asemenea, 
supravegherea activă este o metodă de colectare a datelor, dar în același timp de limitare a 
libertăţilor cetăţenilor. O astfel de supraveghere permanentă determină creşterea stresului 
oamenilor, şi creează tendinţa acestora de a se comporta într-un anumit mod care să se conformeze 


normelor aşteptate. 


Identitatea digitală 


Identitatea digitală are avantajul accesului rapid la conținutul online şi serviciile conexe. 
Utilizarea identităţii digitale are potențialul de a genera discriminare bazată pe reprezentarea unei 
persoane conform datelor ei online, care de multe ori poate să nu corespundă cu situaţia reală, într- 
un proces numit "dictatura datelor” în care "nu mai suntem judecaţi pe baza acțiunilor noastre, ci 
pe baza a ceea ce indică toate datele despre noi ca fiind acţiunile noastre probabile", (Norwegian 


Data Protection Authority 2013) interacțiunea personală nefiind plasată într-un plan secundar. 
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Realitatea ajustată 


Orice interacțiune a noastră cu Internetul implică posibilitatea stocării datelor noastre 
personale. Prelucrarea și analiza acestor date determină rezultatele personalizate care ne apar 
ulterior pe Internet, prin rezultate ale căutărilor noastre, afișarea produselor în magazinele online, 
afișarea reclamelor, etc. Se generează astfel o versiune mai îngustă și mai personalizată a 
experienţei online anterioare a unui utilizator (aşa-numitul "balon de filtrare" (Pariser 2011)). Un 
avantaj este că utilizatorul va găsi rapid ceea ce caută de obicei, dar excluderea anumitor aspecte, 
perspective şi idei poate duce la o restrângere a creativității şi dezvoltarea unei atitudini tolerante 
prin izolarea politică şi socială de celelalte aspecte, prin lipsa unor viziuni pluraliste. (Crawford, 


Gray, and Miltner 2014) 


De-anonimizarea 


De-identificarea implică ştergerea sau ascunderea elementelor care ar putea identifica 
imediat o persoană sau organizație. Legislaţia din diferite țări privind protecția datelor defineşte 
tratamente diferite pentru datele identificabile. Identificabilitatea este văzută din ce în ce mai mult 
ca un continuum, nu un aspect binar. Riscurile de divulgare cresc simultan cu numărul de variabile, 
de surse de date și cu puterea analizei datelor. Riscurile de dezvăluire pot fi atenuate, dar nu 
eliminate. De-identificarea rămâne un instrument vital pentru asigurarea utilizării în siguranţă a 
datelor. (UK Data Service 2017) 

Informaţii perfect anonime luate separat, pot fi combinate cu alte date pentru a identifica 
în mod unic o persoană cu grade diferite de certitudine. Profilarea poate deveni un instrument 
puternic, ridicând îngrijorări cu privire la gradul în care este permisă intruziunea în viaţa unui 


individ, posibilitatea asigurării securităţii, şi supravegherea. 


Inegalitatea digitală 


Avantajele dimensiunii mari a datelor sunt clare, dar există şi opinii conform cărora 
acumularea de date la o scară uriașă prezintă riscuri specifice. Din această cauză, sunt puține 
entităţi care au acces, prin infrastructură și abilități, la sistemele Big Data. În acest context, 
costurile și abilitățile necesare accesului duce la anumite inegalităţi digitale specifice abordate de 


etică. 
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Confidenţialitatea 


În tranzacţiile de date este foarte important să se asigure confidenţialitatea: 


"Nimeni nu va fi supus la interferenţe arbitrare cu intimitatea, familia, casa sau corespondența sa 
şi nici la atacuri asupra onoarei şi reputației sale. Toată lumea are dreptul la protecția legii 
împotriva unor asemenea ingerințe sau atacuri. "- Declaraţia Organizației Naţiunilor Unite 
privind Drepturile Omului, Articolul 12. 


În multe ţări, monitorizarea publică datelor de către guvern pentru a observa cetăţenii 
necesită o autorizare explicită printr-un proces judiciar adecvat. Confidenţialitatea nu este despre 
păstrarea secretelor, ci despre alegere, drepturile omului, și libertate. 

Adesea confidenţialitatea este văzută în mod greșit ca o alegere binară între izolare şi 
progres ştiinţific. Protejarea identităţii în date este posibilă tehnologic, de exemplu utilizând 
criptarea homomorfă și designul algoritmic. 

Confidențialitatea ca o limitare a utilizării datelor poate fi, de asemenea, considerată ne- 
etică, (Kostkova et al. 2016) în special în asistența medicală, dar trebui ținut cont de faptul că este 
posibilă extragerea valorii datelor fără a compromite intimitatea. 

Confidențialitatea este recunoscută ca un drept uman prin numeroase reglementări 
naționale şi internaționale. Confidenţialitatea în cercetare se realizează printr-o combinaţie de 
abordări: limitarea datelor colectate, anonimizarea acestora; și reglementarea accesului la date. În 
cazul cercetării Big Data apar probleme specifice: ambiguitatea între termenii "privațiune” și 
"confidenţialitate; declararea spaţiilor sociale ca publice sau private; necunoașterea riscurilor de 
confidenţialitate de către utilizatori; distincţia neclară între uzanţele publice și private. În prezent 
există dispute dacă ştiinţa datelor ar trebui să fie clasificată ca o cercetare a subiecţilor umani, şi 


deci nesupusă normelor obişnuite de confidențialitate. 


Cercetarea Big Data 


Prin noile concepte de "daune algoritmice", "analize predictive", etc., algoritmii folosiți în 
prezent în operațiunile Big Data depăşesc viziunea tradițională a confidențialității. Conform 
Consiliului Naţional pentru Ştiinţă şi Tehnologie, 


”"Algoritmii analitici” sunt algoritmi pentru prioritizare, clasificare, filtrare și predicție. Utilizarea 
acestora poate crea probleme de confidenţialitate atunci când informaţiile utilizate de 
algoritmi sunt inadecvate sau inexacte, atunci când apar decizii incorecte, atunci când nu 
există mijloace rezonabile de recurs, atunci când autonomia unui individ este direct legată 
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de rezultatul algoritmic sau atunci când folosirea algoritmilor predictivi încurajează alte 
daune asupra vieţii private.” (NSTC (National Science and Technology Council) 2016, 18) 


Cercetările Big Data sunt ceea ce eticianul James Moor ar numi "harababura conceptuală" 
datorită "incapacității de a conceptualiza în mod corect valorile etice și dilemele de joc într-un 
context tehnologic nou.” (Buchanan and Zimmer 2018) În această situaţie confidenţialitatea este 
asigurată printr-o combinaţie de diferite tactici şi practici (medii controlate sau anonime, limitarea 
informaţiilor personale, anonimizarea datelor, restricţii de acces, securizarea datelor, etc.). În 
general, toate noţiunile conexe devin confuze în cazul Big Data. Astfel, postările sociale sunt 
considerate publice în rețelele sociale în cazul unei setări corespunzătoare. Dar rețelele sociale sunt 
medii complexe de interacțiuni socio-tehnice unde utilizatorii nu înţeleg întotdeauna 
funcționalitatea setărilor şi termenii de utilizare. Astfel, există o incertitudine în ceea ce priveşte 
intenţiile şi așteptările utilizatorilor, iar aceste deficienţe conceptuale în contextul cercetărilor Big 


Data conduc la incertitudini în ceea ce priveşte necesitatea consimțământului informat. 
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